CHI2019精华回顾3 - 你好，智能助手 | 自由微信

CHI2019精华回顾3 - 你好，智能助手

Original 百度AI交互设计院百度AI交互设计院 2020-09-15

人机交互领域的顶会CHI 2019于5月4日-5月9日在英国格拉斯哥召开。每年CHI上都汇集了来自世界各地人机交互领域研究的最新成果。百度AI交互设计院将陆续推出CHI 2019精华回顾，此为第3篇，为大家介绍本次CHI 2019中关于对话式智能助手（conversational agent）的相关研究。

导读

01 对话式智能助手@CHI2019

02 对话式智能助手工作坊

03 对话式智能助手研究盘点

对话式智能助手@CHI2019

过去5年，越来越多的产品支持用户通过文字或者语音和机器对话。这些产品类别丰富，涵盖智能助手（Intelligent assistant，如苹果的Siri，亚马逊的Alexa，百度的小度），虚拟伴侣（Virtual companion，如微软小冰），任务导向的聊天机器人（Chatbots，如点餐机器人、客服机器人）等，在此我们统称它们为对话式智能助手（conversational agent）。

从左到右依次为：苹果Siri对话界面、亚马逊Echo智能音箱、百度小度智能音箱、微软小冰对话界面、达美乐点餐机器人对话界面（图片来源：产品官网、产品手机对话界面截图）

对话式智能助手为用户带来了便利，也为研究人员带来了新的设计洞察与研究思考。据百度AI交互设计院基于相关关键词检索及阅读后统计，在CHI 2019上，对话式智能助手主题下共有50多篇相关的研究论文，其中Paper论文25篇、Poster论文22篇，另有案例研究（Case Study）、竞赛（SRC）等形式论文5篇，是CHI 2019上受关注度较高的研究领域之一。

CHI组委会对“对话式智能助手”研究保持着持续性关注与认可。在去年的CHI 2018，英国诺丁汉大学的研究《 Voice interface in everyday life》（生活中的语音交互）获得了最佳论文奖（Top 1%）。

面对该研究领域的快速增长，CHI 2019组织了对话式智能助手的专题工作坊《Conversational Agents: Acting on the Wave of Research and Development》，共有20多名来自世界各地的研究者探讨关于对话式智能助手的现状和未来，百度AI交互设计院也参与其中，分享中国的研究经验和用户洞察。

CHI 2019上，评审委员会也对相关论文给予高度青睐，英国布里斯托尔大学的研究《Voice User Interfaces in Schools: Co-designing for Inclusion with Visually-Impaired and Sighted Pupils》（学校中的语音交互：与混合视觉能力学生的共创设计）获得今年的最佳论文奖（Top 1%），另有两项研究获得了最佳论文提名奖（Top 5%）。

本篇文章将回顾本次大会上关于该主题的相关研究和探讨，和大家进行分享。

对话式智能助手工作坊

对话式智能助手工作坊由微软研究院组织，于2019年5月4日召开，为期一天，面向对话式智能助手应用和研究领域的先进企业和学术机构，旨在共同交流近两年来大家在用户需求、体验、认知等方面积累的研究经验与设计洞察，一起探讨当前智能助手面临的机遇和挑战。工作坊吸引了来自微软、IBM、百度、联想、卡耐基梅隆大学、斯坦福大学、华盛顿大学、滑铁卢大学等企业和高校的研究者，共计20余人参与。

CHI2019对话式智能助手工作坊，第二排右四为百度AI交互设计院资深用户研究员葛翔

在工作坊发起阶段，每个参与者需要提交一篇position paper阐述自己的研究领域和工作进展，组织者就投稿paper筛选录用了20多名参与者。此外，组织者就智能助手的发展应用、用户洞察提炼出了15个研究主题（如图），并在此基础上由参与者邮件投票，选出了5个最为关注的主题，它们分别是User perceptions（用户感知）、Usage and engagement（使用和互动）、Context（情境理解及应用）、Modalities（多通道）、Humans as partners（人机协同）。

对话式智能助手细分研究主题

工作坊由微软MSR AI首席UX研究员Richard Jacue主持，分为三个环节：

首先，主题陈述。基于此前选定的5个主题，由来自IBM 沃森研究院的研究科学家王大阔、挪威SINTEF高级研究员Asbjørn Følstad、英国爱丁堡大学研究员Ewa Luger、微软首席研究员Jonathan Grudin、Snap首席研究科学家Andrés Monroy-Hernández分别就这几个研究主题进行了陈述，分享了该主题的研究价值，及该主题下值得关注的研究问题。

其次，破冰与主题讨论。参会者轮流陈述自己的研究背景及研究内容，后根据5个不同研究主题分为5组，进行专题讨论。百度AI交互设计院的资深用户研究员葛翔和大家分享了百度在智能产品用户群体和感知、智能产品人设等方面的研究结果，与来自挪威SINTEF、伦敦玛丽女王大学、米兰理工大学等研究者一起，进行了User perceptions专题讨论。

参与者研究结论提炼poster（图片来源：CHI 2019 Conversational Agents工作坊）

最后，开放问题收集与讨论。在工作坊后半段，主持人邀请大家写下自己在对话式智能助手领域最关注的2-3个注研究问题，并基于相应问题展开讨论。20多名参与者共输出了61个研究问题，覆盖对话设计、体验测量、情感理解、记忆和遗忘、信任、人机关系，均为对话式智能助手领域的前沿核心问题，相信这些问题也将在未来1-3年内得到研究解决。

现场收集的研究问题（图片来源：CHI 2019 Conversational Agents工作坊）

对话式智能助手研究盘点

1、谁在关注这个话题

对话式智能助手的研究在全球范围内受到广泛关注，CHI2019的50多篇相关研究论文来自15个不同国家，其中美国最多（18篇），韩国其次（12篇）, 此次有2篇研究来自中国地区，分别是清华大学的关于人机对话时的情感信息传递研究，国立台湾科技大学关于智能助手的角色和关系定位研究。

我们可以看到，韩国在本次大会上发表了较多的论文，这一定程度上和该国市场情况吻合。2018年，韩国本土品牌的智能音箱逐渐崛起，同时国际巨头开始进入韩国市场，据全球知名市场分析公司Canalys 2018年预测，韩国智能音箱市场份额将跻身世界前五（前四分别是美国、中国、英国、德国）。

中国智能语音交互市场相对韩国更为火热且增长迅猛。Canalys 发布的2019年 Q1 全球智能音箱市场报告显示，中国市场智能音箱出货量全球占比达到51%，首次超越国外市场。其中，百度小度智能音箱出货量达330万台，仅次于谷歌的350万台及亚马逊的460万台，成为中国市场第一，全球市场第三。中国智能人机交互领域也在近一两年蓬勃发展，各企业和大学相继成立研究机构（如院、所、实验室、中心等形式），进行相关领域的研究。企业方面，有百度2017年11月成立“人工智能交互设计院”并持续向业界发布研究成果，阿里2018年4月在达摩院下设人机自然交互实验室，并与清华大学共建“清华大学-阿里巴巴自然交互体验联合实验室”、华为终端2018年8月成立的基于IOT互联互通的“方舟实验室”。学界方面，有中国科学院大学2017年9月成立人工智能技术学院下设智能人机交互教研室，清华大学2019年5月在人工智能研究院下成立“智能人机交互研究中心”。无论是市场驱动还是研究引领，相信在未来1-2年，会有越来越多的中国研究者在该领域向国际发声。

2、他们在研究什么

50多篇研究关注点不一，但仍可由前文工作坊提炼的15个主题覆盖。接下来，我们结合百度AI交互设计院的研究兴趣，及论文本身主题研究数量、大会认可度、应用场景、社会价值等因素，选择5个主题和其中的6篇代表性研究成果，进行简要介绍。

①智能助手的人格/角色设计

对话式智能助手在家居、车载等与生活紧密联系的场景应用广泛，这促使研究者对用户感知智能助手的人格/角色最为关注，相应的研究论文也最多。值得一提的是，部分研究者除了研究智能助手的人格之外，还关注用户人格特质和智能助手人格特质的匹配问题。

Paper 1：

题目：At Your Service: Designing Voice Assistant Personalities to Improve Automotive User Interfaces

作者单位：BMW集团研究中心

语音智能助手在现实生活中的应用范围愈加广泛和重要，但是却共同面临一个问题：当前的语音智能助手都用一成不变的风格应对各种不同的用户、情境，并不能满足用户的不同需要。为了解决这个问题，研究者以“主导/服从”和“敌对/友好”二维模型设计出四种不同类型的人格（朋友、倾慕者、阿姨、仆人），并和当前默认的人格进行对比测试。在测试之前，研究者用大五人格量表测量了用户自身人格。实验过程中，研究者基于用户的人格分配某一人格类型的智能语音助手。随后。用户进行两轮实际驾驶任务，先后体会该人格类型的智能助手与默认人格类型的智能助手，并进行评分。实验结束后，用户从4种人格类型中挑选自己最喜欢类型。结果发现，如果分配的智能助手的人格是用户喜欢的，相较于默认的人格类型，用户对它的信任、喜好度更高；相反如果之前的分配结果不是用户喜欢的，那么用户对于它的评价会比默认的人格类型更低。

人格设计及实验过程（视频来源见附录[1]）

②智能助手服务于特殊群体

随着语音交互的发展，人和机器能够以更加自然的方式进行交流，这也为特定人群提供了更多可能，比如对于认知障碍人群的辅助治疗，比如视觉受损人群的学习等。

Paper 2：

题目：Voice User Interfaces in Schools: Co-designing for Inclusion with Visually-Impaired and Sighted Pupils（最佳论文奖）

作者单位：英国布里斯托尔大学

语音交互虽然在家庭中越来越受欢迎，但是相对较少有研究关注语音交互在其他环境(如学校)中的使用潜力。研究者认为语音交互在支持全纳教育（全纳教育是在1994年《世界特殊需要教育大会》上通过的一项宣言中提出的一种新的教育理念和教育过程，它提倡消除阻碍所有学习者参与和成功的障碍，尊重不同的需求、能力和特点，消除学习环境中一切形式的歧视，让不同的种族、性别、能力等的人群都能平等地接受教育。）方面有重要作用，尤其是针对视力受损的学生。基于这种愿景，研究者与英国某学校的教育工作者、政府的支持人员对27名学生组织了有针对性的调研、讨论。之后，他们邀请正常视力学生、视力受损学生一起举办了一系列联合设计工作坊，由此设计了一个具有教育意义的语音交互应用程序。该程序能够为主流学校中有视力障碍的学生所面临的挑战提供见解。论文最后，研究者也反思了组织混合视觉能力群体合作设计的一些经验和注意事项。

共创设计过程（视频来源见附录[2]）

③公共场合下的智能助手

智能助手除了在个人生活和工作领域广泛应用之外，在很多公共场合也越来越常见，研究者开始把目光关注于该类场合下体验和设计。公共场合下，同行人、陌生人、客观环境等因素都有可能影响该用户的行为和态度。

Paper 3：

题目：The Effect of Audiences on the User Experience with Conversational Interfaces in Physical Spaces（最佳论文提名奖）

作者单位：IBM研究院、米纳斯吉拉斯联邦大学

在公共场合下，如果有他人在场时是否会影响用户和对话式智能助手的交互行为和意愿呢？为了回答这个问题，研究者设计了两个研究，两个研究都是基于某一艺术展览馆的智能助手完成的。研究1探索了“没有他人在场”、“有熟人在场”、“有陌生人在场”时，用户对于智能助手的主观感知是否有所不同。结果发现，当有熟人在场的用户认为智能助手更少回答了自己的问题，而有陌生人在场的用户则相反。研究2基于5000多条对话日志数据和无声录像，分析了“没有他人在场”、“有熟人在场”、“有陌生人在场”时，用户交互的行为和问的问题是否有所不同。研究在把对话内容聚类成4类（非主题相关的内容、关于智能助手的内容、问候的内容、回应对话失败的内容），结果发现当有熟人在场时，用户更倾向于回应智对话失败。

“有熟人在场”的对话现场（图片来源见附录[3]）

④隐私和安全

隐私和安全一直是人机交互领域的热门关注点，对话式智能助手也不例外。本次大会上，研究者从不同角度探讨了隐私和安全的问题，比如隐私和安全因素对于语音交互产品的购买决策的影响，如何提升语音在某些敏感任务下（支付、解锁等）的安全性。除此之外，来自于宾夕法尼亚大学的研究者探讨了信息敏感度、载体（智能音箱 vs 智能手机）、交互方式（语音 vs 文本）之间的相互影响，以及它们如何影响用户的感知。

Paper 4：

题目：Hey Google, Can I Ask You Something in Private?

作者单位：宾夕法尼亚州立大学

现代语音助手允许用户通过不同的输入模式和设备共享和询问个人的信息。本研究基于Google智能助手开展，研究了当用户尝试从智能语音助手检索敏感健康信息时，交互方式（即语音 vs 文本）和设备（智能手机 vs 智能家居设备）的不同是否会影响用户感知。该研究表明，在用户询问和分享不太敏感的健康相关信息时，语音交互比文本交互显著增强了用户对智能语音助手的社交存在感知和积极态度，但是在高敏感信息则没有差异。而是无论所询问的健康信息的敏感度如何，设备差异不会影响用户对语音助理的态度。

交互方式和信息敏感度对于智能助手感知影响（图片来源见附录[4]）

⑤细分群体的差异化设计

在广泛的用户群体中，基于儿童、老人的人群特点进行差异化设计一直是人机交互领域研究者常见的关注问题，本次大会上，有多篇Poster论文关注于该主题。

Poster 1：

题目：Explorations of Voice User Interfaces for 3 to 4 Year Old Children

作者单位：爱荷华大学

语音交互为幼儿提供了与外界互动的潜在优势，但是过往的语音用户界面（VUI）的设计和研究主要集中在成年人上，而与幼儿相关的应用主要集中于媒体播放、回答、或一些高度结构化的互动中。研究者认为语音交互可以创造出更多高质量，创造性的社交游戏，并通过与儿童合作设计课程来实现这一点。本研究作者计划通过由8个3至4岁儿童参与合作实现24个设计课程，本文主要阐述了作者在第一阶段的研究发现。

儿童互动展示（视频来源见附录[5]）

Poster 2：

题目：Older Adults and Voice Interaction: A Pilot Study with Google Home

作者单位：波兰国家信息处理中心、波兰-日本信息技术学院、Kobo协会

家居场景下，老人是智能语音产品的重要使用群体之一，但是关于他们在使用语音交互，体验如何关注较少。为了探索这些方面，研究者组织了两场研讨会，收集了老人群体在使用语音交互的好处和困难，并针对这些困难提出相应的改进建议。

写在最后

以上是百度AI交互设计院对CHI 2019中对话式智能助手相关内容的梳理，包括CHI2019对话式智能语音助手工作坊、对话式智能助手论文收录情况、及部分研究主题和研究成果的简要介绍。希望有助于您快速了解对话式智能助手研究，也欢迎感兴趣的您与我们互动留言讨论。

在上篇的《CHI精华回顾2：来自中国的人机交互力量》及本篇回顾中，我们欣喜地看到，来自中国的企业和学界，越来越多参与到国际前沿的人机交互研究交流之中。

而许多在此次大会中探讨的研究主题，我们在以往的研究中亦有所涉猎，如人设和音色（《赋予智能语音产品灵性之美，从“人设”的探索开始》）、对话式智能助手的话术设计（《“会说话的人，一开口就赢了”——语音交互中的机器话术研究》）、多通道交互（《多维对话——走向视听融合的语音交互新体验研究》）、儿童的语音交互（《如何设计一款儿童喜爱的智能音箱》）、智能体的信任（《AI人机交互趋势研究2019》）等等。

为此，我们也呼吁更多同行者与我们一起，更多参与到AI人机交互领域的研究中来，并增进彼此交流与分享，一起推进中国智能人机对话、AR/VR、机器人、无人驾驶等相关领域人机交互的发展。

关于CHI 2019，百度AI交互设计院后续还会带来AR/VR及其他领域的分享内容，请您持续关注！

视频及图片来源：

[1] https://www.youtube.com/watch?v=OuT592PgsDQ

[2] https://www.youtube.com/watch?v=vA0yBg9fbQk&t=42s

[3] https://www.youtube.com/watch?v=yYNWWb-VmTg

[4] 图片来源于研究者论文

[5] https://www.youtube.com/watch?v=cyHihorka60

部分视频及图片来源于网络，本文仅做梳理，版权归原作者所有，如有侵权请联系删除。

CHI2019精华回顾2：中国的人机交互力量

CHI2019精华回顾1：触摸未来人机交互

百度关岱松：将在全线产品上线百度设计语言D20

观察｜官方通报陕西蒲城一职校学生坠亡：事发前与舍友发生口角和肢体冲突认定该生系高空坠落死亡

桐城一派｜倒在“跨年夜”的龚书记，13个字换来免职调查冤不冤？

13岁！史上最严重霸凌案宣判，如何亡羊补牢？

比佟丽娅还恋爱脑，怀孕7次流产4次，目睹丈夫背叛却选择原谅

市管干部“龚书记”免职迷局